时政
财经
科技
虚拟货币
其他
登录
#DeepSeek OCR
关注
Andy Stewart
3周前
这玩意小型化以后配合DeepSeek OCR或者Paddle OCR 就可以把自己喜欢的书电子化保存 🤓
#书籍电子化
#OCR技术
#DeepSeek OCR
#Paddle OCR
#个人知识管理
分享
评论 0
0
Michael Anti
1个月前
Deepseek OCR终于上硅基流动了,还没上Openrouter。我试一试爽一爽。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#DeepSeek OCR
#硅基流动
#Openrouter
#技术测评
#期待
分享
评论 0
0
Andy Stewart
1个月前
DeepSeek OCR已上架懒猫微服应用商店 😀
DeepSeek数据泄露:德国下架,信任崩盘· 446 条信息
中国DeepSeek引发美国科技股暴跌事件· 170 条信息
#DeepSeek OCR
#懒猫微服应用商店
#应用上架
#积极
分享
评论 0
0
WY
1个月前
DeepSeek刚发的OCR模型有点小火,一方面是突出的性能,号称压缩10倍还有97%准确率,另一方面关于用分辨率来模拟遗忘机制的假想,恰巧AK在最近的访谈中说人的遗忘是一个feature而不是bug。 DeepSeek OCR模型很有意思的一点是提供了好多个“分辨率”选项,并且看起来用的token很少。最低的512 x 512一张图只需要64个token,稍大一点的1024 x 1024是256个token。复杂版面还组合使用多种分辨率,首先是整张图用i个1024 x 1024,此外重点区域可能用多个640 x 640。 不少人惊呼太牛逼了,一张图只需要几十个token。其实至少在学术界,这样的视觉编码效率并不算很大的突破。 目前看不到技术细节,但DeepSeek OCR的搞法,怎么看怎么像去年字节的那篇best paper的思路(还记得去年字节有个实习生搞破坏被公司索赔800万吗,他就是paper的作者)。那篇paper是去年顶会NeurIPS的best paper,提出的Visual Autoregressive Modeling(VAR)方法就是采用"粗到细"的多尺度预测,逐步从低分辨率扩展到高分辨率。 另外,去年豆包团队也有一篇paper,把512 x 512的图片也是编码到了64个token,和DeepSeek OCR一模一样。那篇paper还能把256 x 256的图片编码到更小的32个token。DeepSeek OCR模型毕竟是要做文字识别而不是场景理解的,可能因此舍去了不太实用的256 x 256尺寸。 很有可能DeepSeek OCR是受到了这两篇paper很大的启发,把它进一步工程化产品化了。从过往的记录看,DeepSeek团队特别把其它实验室的研究成果进一步做扎实,产品化。 至于用分辨率来模拟遗忘机制的假想,确实是个有点意思的想法,但也感觉有点不太对。越来越模糊的分辨率,感觉模拟的更像是越来越高度的近视,这是一种很好的遗忘机制吗? 另外,人脑的遗忘机制可能适合人脑,未必适合数字的第二大脑。人脑要遗忘也可能是因为一个人的脑容量毕竟有限,数字系统容量可以一直扩,是不是一定要遗忘呢。 这些都是问题。这得多想想。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#DeepSeek OCR
#分辨率模拟遗忘
#多尺度预测
#字节跳动VAR
#工程化产品化
分享
评论 0
0
orange.ai
1个月前
DeepSeek OCR 论文里的想法太有意思了。 用光学压缩模拟人类记忆遗忘机制,还有点 callback AK 的会遗忘的智能了。。。 人类记忆有个特点: 一小时前的事,清清楚楚 一周前的事,开始模糊 一年前的事,几乎忘光 视觉感知也一样: 10cm的东西看得清楚 20m的东西几乎看不清 DeepSeek想到一个绝妙类比: 用分辨率来模拟这种衰减 他们设计了对应关系: 近期对话 → Gundam模式(800+ tokens) 一周前 → Base模式(256 tokens) 久远记忆 → Tiny模式(64 tokens) 这样既保留了历史信息,又控制了token数量。 远期记忆自然"淡化",就像人类遗忘一样。 如果真的能做到,就能实现"理论上无限的context window"。 因为你不需要保持所有信息的高保真度,只需要让信息随时间衰减。 遗忘本身是一种优化策略。 人类会遗忘,不是因为大脑容量不够,而是因为遗忘让我们更高效。 DeepSeek把这个生物学直觉,转化成了工程实现。 这条路如果走通了,可能会改变我们对长上下文问题的理解: 不是无限扩大context window,而是让信息自然衰减。
深度学习模型升级引发AI能力大跃进,行业迎新变革· 143 条信息
#DeepSeek OCR
#光学压缩
#记忆遗忘机制
#长上下文
#信息衰减
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞